查看原文
其他

如何实现大数据价值?(上)

数治君 数据信任与治理 2022-03-29


本文编译自《辩论大数据:从大数据中实现价值的文献综述》(Debating big data:A literature review on realizing value from big data),作者:Wendy Arianne Günther, Mohammad H. Rezazade Mehrizi, Marleen Huysman, Frans Feldberg

为保证阅读的流畅性,本文对脚注及正文内容有删减。

1.引言

大数据被誉为“网络商业环境中破坏性变革的母矿”,大数据能够为组织在诸多领域带来利益。大数据被视为产品、服务、商业升级的要素,利用大数据可以提高决策和战略制定水平,获得进一步的社会和经济价值。


本文将涵盖大数据的社会价值和经济价值。社会价值包括在教育、医疗以及公共安全和安保等领域的社会福利改善,包括个人利益及社会利益。经济价值可以通过大数据带来的利润增长、业务增长和竞争优势进行衡量。本文旨在分析组织为何能(或未能)将大数据的潜力转化为社会和经济价值,研究何种策略能够促进大数据价值的实现。


本文回顾了关于大数据价值的文献,确定了实现大数据价值的六个核心争议,并呼吁进行实证研究。本文提出,可携带性和互联互通(interconnectivity)是影响组织实现大数据价值的两个社会技术特征。在结论中,本文围绕大数据文献中六个争论,在工作实践、组织和超组织层面进行了讨论并提出了哪些特征促成了大数据的价值实现。


2. 研究方法

2.1 搜索和选择

本文检索和选择文献的流程如下图所示:



2.2 文献分析与综述

本文侧重于总结和分析实现大数据价值的现有理论,突出主要相关争论、寻找支持证据以及文献的空白,旨在提供新的见解。


本文分别就“工作实践”、“组织”和“超组织”三个层面围绕如何实现大数据的价值价值抽象出了若干准则。“工作实践”层面是指组织内部个体在日常互动中使用大数据的行为;“组织”层面是指组织协调其活动以实现特定目标的结构、规范、资源和程序;“超组织”层面是指制度和技术生态系统的关系。


本文对每个争论都阐明了两种不同的立场,审查了不同行为主体所采取的行动、争论形成的背景及影响实现大数据价值的原因。本文将在下一节中详细阐释每一个争论。



3. 大数据文献中的六大争论


本文从文献中总结出了在工作实践、组织层面和超组织层面实现大数据价值时的六大核心问题争论。


3.1 工作实践层面:在实践中使用大数据


3.1.1 大数据分析的归纳和演绎方法

 “大数据”的来源既有组织内部的(如经营数据)又有组织外部的(如传感器数据),数据的产生和收集往往与使用目的不同,也就很难预料可以最终从数据源中获得什么。这就催生了一种没有预设目的的收集数据模型:自上而下、归纳式的大数据收集和分析方法。研究表明,由于数据可以以新的方式组合和分析,为某一目的收集的数据可以用于其他目的。


Tamm等人采访了商业分析专家,评估了他们从大数据中“获得价值的途径”。专家认为,提供对大数据分析的咨询服务的价值,必须与没有明确重点或商业案例的情况下通过数据挖掘得到结论所付出的努力相称。因此,学者们认为大数据分析可以有演绎性的方法,即“从一般理论(假说)开始,然后使用特定数据进行测试该理论”。但是,演绎法可能存在确认偏误的风险,特别是当决策者专门寻找特定数据来证明他们的假设时。


Bholat认为,归纳法和演绎法在实践中是相互交织和互补的两种理想方法。归纳和演绎在实践中是否可以达到平衡,在一定程度上取决于解释数据的人预先存在的参考框架或心态的影响程度。就此引出了工作实践层面的另一个争论—算法和基于人类的智能的问题。



3.1.2 算法智能和人类智能

人类在处理和解释数据时可能会受到不同因素的影响。为了减轻这种影响,学界和实务界不断探索算法速度和处理能力的潜力,算法智能越来越受欢迎,组织够依靠它分析大数据。


支持算法智能的人认为,算法“引导分析师创新分析的概念和分类”。算法通常遵循固定的、预先编程的程序,但可以推导出新的模式和观点。人工智能或复杂的机器学习算法甚至能够改进程序。算法越来越能够实时预测人类行为。除了大数据,算法还可以提高运营和战略决策的自动化程度。


学者们还强调了人类智能的重要性,人类智能需要检查数据和模型,并获得、部署和完善见解。Madsen发现,在数字社交分析的某些情况下中,分析师正在“引导自动算法,以反映在他们将产生影响的背景下可识别的类别”。一些学者认为,决策者对算法的过度依赖可能会导致相关知识的损失,特别是当算法如何得到特定的结果、模式和决策还不清楚时。部分学者认为,大数据分析过程“把一个人在设定在循环中”。


这两种智能各有优劣,并能够互相提升。因此,有人提出组织应该寻求平衡他们的方法,学者们开始探索算法智能和人类智能之间的相互作用。


在工作实践层面研究大数据的学者们讨论了不同主体如何与大数据合作,并从大数据中获得潜在价值的见解。此外,工作实践层面的争论是否具有独特性同样值得怀疑。技术在工作场所自动化和“信息”方面的作用已经在早期的研究中得到了阐述。大数据是否真的会导致工作实践的变化,还有待观察。目前并不清楚人类和算法智能在不同情况下的洞察力创造中有哪些具体贡献。


3.2 组织层面:开发组织模型

在组织层面,本文总结了关于组织如何开发大数据能力结构和改变商业模式以实现大数据价值的争论。



3.2.1. 集中式和分散式大数据能力结构

文献中提出了许多能够访问、跟踪、收集、管理、治理、处理和分析大数据的功能,以实现数据驱动的决策的制定和执行。组织面临的问题不仅是如何获得或开发技术和人力资源,还包括如何在团队或部门中构建它们。


一方面,分析能力中心的发展被认为是集中资源以解决分析技能短缺的有效方法。能力中心是“拥有商业分析专业知识并为商业单位提供服务的中央单位”。研究表明,集中化简化了数据治理架构,去中心化使跨组织单位和部门的数据治理变得困难。


另一方面,集中化能力结构的有效性受到了质疑。集中化能力结构可能无法“很好地与业务单位联系在一起”,从而难以“通过业务单位的竞争行动将他们的想法转化为价值”。集中化的结构可能会限制与大数据项目中不同商业利益相关者的沟通和参与,而这种交互对于实现大数据价值至关重要。此外,多学科团队不同技能的结合、将数据分析师安排在接近业务的地方也是大数据成功的因素。


进行分析设计时,组织可能会评估集中能力结构的协同效益,并认识到需要去中心化相关的特定专业知识。集中式和分散式结构的混合被认为是一种可行的折中方案。



3.2.2. 大数据驱动的商业模式改进与创新

许多文献承认数据是组织商业模式潜在的关键资源。商业模式“反映了已实现的战略”以及组织如何创造和占有价值。初创企业能够更容易地建立新的数据驱动的商业模式,已有企业不得不重新考虑现有的商业模式以及这些模式如何受到大数据影响。


使用大数据分析的方法之一是通过新的技术和访问新的数据源,改进现有流程的效率和有效性。长远看来,通过数字化和大数据分析对现有商业模式的逐步增强可能会取代效率较低的商业模式。


大数据可以使组织从根本上改变他们的商业战略,并进入新的行业环境。当大数据引导组织开发新的价值、针对不同的客户或以不同的方式与客户互动时,组织可以通过销售和交易数据,或通过新的价值主张增强客户体验,创新商业模式并使数据货币化。


研究表明,通过商业模式利用大数据,改进和创新的方法可以是混合的,也可以是循序渐进的。此外,组织采用大数据和创新能力的程度取决于行业和组织的规模:从一个成熟阶段到另一个成熟阶段需要能力的发展,而这些能力主要来自于大型组织拥有的资源。


综上所述,在组织层面上,学者们一直在讨论如何从大数据中开发出合适的组织模型来创造和占有的价值。但关于如何在实践中实现这一点的文献很少。尽管给出了集中式能力结构的例子,但通常并不清楚这些结构是如何实践的。虽然一些学者强调分散结构的重要性,但这种结构的例子很少被讨论。此外,商业模式改进与创新是新兴的讨论话题,但缺少实证研究。


3.3 超组织层面:处理利益相关者的利益

在组超组织层面,利益相关者包括:大学和研究机构,政府、数据提供商、用户和客户。本文在文献中总结了两个关于组织如何管理数据访问以及他们如何处理利益相关者的利益的争论。



3.3.1. 控制和开放大数据访问

有人提出,为了从大数据中获益,组织需要与其合作伙伴进行数据交换,并参与数据披露和筛选。根据数据访问的控制和开放程度,已经形成了不同的组织间治理模式。


基于隐私安全、市场竞争等原因,组织可能不愿意与网络伙伴共享或交换数据,或者更倾向于控制数据访问,通过分层的方式控制对数据和算法的访问。


与此同时,开放访问模式正在出现。在这种模式下,数据对所有人都是公开的,商业组织和政府可以选择开放数据,以刺激创新和提供透明度。当每个人都有可能访问数据时,协调生产和共享就会超出组织控制。在这些开放式访问模式中,数据由“为数据生产设定规则”的IT基础设施构成。但有猜测认为这样的基础设施可能被(故意)修改,从而影响数据的可靠性和质量,并可能阻碍其复制能力,或者导致组织不再愿意提供数据。


证据表明,开放模式和控制模式都可以形成数据共交换网络。作为数据产品的数据源和接受者的消费者、用户和公众正变得越来越活跃,这些主体也应该被视为合法的参与者。因此,组织必须解决共享和使用数据的法律和伦理问题。这在超组织层面引发了另一场争论。



3.3.2. 大数据价值实现的社会风险

实现大数据的价值往往也会带来社会风险。例如,集合个人数据源的分析可能会暴露极为私人和敏感的信息。当前,基于大数据分析的个性化产品和服务的趋势引发关于隐私、身份盗窃、非法歧视等担忧。此外,尽管政府和其他组织对个人的监控可能会改善公共控制和安全,但也会消减个人的自由、隐私和自治感。组织在利用大数据实现价值的过程中,在监管和立法的同时还需处理公众期望和伦理问题。


对于组织处理高度敏感数据(如医疗保健)或政府影响相当大(如教育)的行业,法规严格限制了大数据的收集和使用。组织可采取广泛措施来遵守这类行业法规,避免非法或不道德的数据使用带来的声誉损害风险。例如,为确保数据访问、共享和使用符合法律规定和道德责任,组织可以控制数据访问、实施风险管理、仔细确定数据目的、明确询问用户授权等,并采用严格的治理实践。组织一直在努力制定数据保留、安全性和处理等方面的数据政策。一些组织甚至认为围绕大数据的隐私和道德辩论提供了利用其隐私主张将自己与竞争对手区分开的机会。


然而,为追求数据驱动的目标,组织有时也不惜牺牲用户隐私。例如将数据使用政策保密,或者剥夺用户在数据收集和共享上的发言权。一些组织利用了大数据监管和立法滞后的情况,在遇到阻力或面临法律措施之前随意地收集和利用数据。


其他组织正试图找到中间立场,例如选择收集但不出售数据,或允许个人“退出”严重依赖于个人数据的服务。然而,找到平衡极为困难,在组织目标是创造社会价值的情形中尤为如此。例如,利用大数据监视来提高公共安全的同时,也会损害隐私权以及其他类型的社会价值;将大数据用于预测分析与确保公民隐私权间的界线十分微妙。


总之,在超组织层面上,各利益相关者可以从共享和合并的数据中互惠互利。数据治理在涉及多个利益相关者时发挥重要作用。虽然多数关于大数据的讨论都较为乐观,但围绕数据所有权和隐私等法律和伦理问题的讨论却并非如此。当某些行为体(通常是组织)通过大数据分析对其他人(通常是个人)施加和利用权力时,许多法律和伦理讨论围绕着社会风险展开。而现有的经验主义研究几乎未触及组织如何以可接受的、创新的方式处理该等问题。


3.4 对文献的批判性分析

现有文献在解释组织如何从大数据中实现价值方面还处于初级阶段,许多著名的论文从理论和实证角度出发。目前,需要进一步的实证研究,仔细审视组织在实践中如何从大数据中实现价值,包括组织内部不同参与者如何在实践中使用大数据、组织模型如何建立、以及组织如何处理不同利益相关者的利益以实现大数据的价值。


组织在每一场辩论中采取何种立场,以及在实践中如何从大数据中实现价值,取决于技术可以实现的目标。因此,需要批判审视大数据的哪些特征影响了大数据价值的实现。


本文下篇将分析大数据的可携带性和互联互通、跨层面相互作用和利益一致性,并提出未来研究的局限性和途径,敬请期待


往期文章:

  1. 数据权属与数据治理之争
    政策制定者应密切关注数据治理(下)
    政策制定者应密切关注数据治理(上)
    当讨论数据所有权时,我们到底在讨论什么?
    没有人拥有数据?(下)
    没有人拥有数据(上)
    数据所有权:问题盘点与总结(上)
    数据所有权:问题盘点与总结(下)

    应该在欧盟引入数据生产者权利吗?(上)

    应该在欧盟引入数据生产者权利吗?(下)

      请扫描二维码获取该系列文章中英文原文:

   2.  欧盟数据治理模式
Gaia-X:下一代数据治理基础设施

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存